YAPAY SNR ALARI LE TRKE TIMES NEW ROMAN, ARIAL VE ELYAZISI KARAKTERLER TANIMA 

ZET 
Yapay Sinir Alar (YSA), giri verilerinin yetersiz olduu, mevcut verilerden hareketle bilinmeyen ilikilerin ortaya karlmas ve algoritmas veya kurallar tam olarak bilinmeyen durumlar iin gelitirilmi bir bilgi ileme sistemidir. Bu almada, yapay sinir alarnn nemli bir uygulamas olan karakter tanma ilemi ele alnmtr. Times New Roman ve Arial biimindeki A dan Z ye 29 Trke karakter kk ve byk harfleriyle birlikte, elyazs karakterler, giri vektr olarak aa sunulmu ve YSAnn eitim ilemi bu karakterler zerinden gerekletirilmitir. Bu karakterler kullanlarak yazlmmetin ieren resime karakter alglama ve tanma ilemi uygulandktan sonra, resim yazs metne dntrlmtr. Bu almada ok katmanl ileri beslemeli bir YSA mimarisi ve geri yaylm renme metodu kullanlmtr. Ayrca C++ Builder yazlm gelitirme ortam ile resimden karakter alglama ve tanma ilemini gerekletiren bir yazlm gelitirilmitir ve uygulamasyaplmtr. 

1. GRtekniinin gereklilii, gerek dnya ile bilgisayar 
ilikisinin balamas ile ortaya kmtr. Bu durum YSA, insan beyninin alma ilkelerinden ilham YSAnn ok gl rnek tanma teknii olarak ortaya alnarak gelitirilmi, arlkl balantlar denilen tek kmasna ve gelimesine neden olmutur [1]. ynl iletiim kanallar vastas ile birbirleriyle haberleen, her biri kendi hafzasna sahip birok Bu almada, resim zerindeki Trke yazyilem elemanndan (nronlardan) oluan paralel ve biimlendirilebilir metne dntrme zerinde datk bilgi ileme yaplardr. YSAlar gerek durulurken, kullanlan resim rnekleri bilgisayar dnyaya ait ilikileri tanyabilir, snflandrma, ortamnda oluturulmutur. Bu nedenle grlt kestirim ve ilev uydurma gibi grevleri yerine minimum dzeyde olmaktadr. getirebilirler. Desen tanma (Pattern recognition) 
O.A. Erdem ve E. Uzun Yapay Sinir Alar ile Trke Tmes New Roman, Arial ve Elyazs Karakterleri Tanma 
2. YAPAY SNR ALARI VE KARAKTER TANIMA 
Yapay sinir alarnn oluturulmasiin rnek tekil eden, biyolojik sinir alarnn ve insan beyninin en temel paralar, hatrlama, dnme, her harekette daha nceki deneyimlere bavurma yeteneini salayan kendine zg sinir hcreleridir. nsan beyninde yaklak 1011 sinir hcresi vardr. ekil 1de basitletirilmi biyolojik bir beyin sinir hcresi ve bileenleri ile ilikisi grlmektedir [2]. 

Yapay sinir alar, bir baka deyile, biyolojik sinir alarn taklit eden bilgisayar programlardr [1]. Bir ok YSA tipi bulunmakla birlikte, en ok kullanlan sinir a yaps, leri Beslemeli Geri Yaylml YSA olarak bilinendir. Belirsiz, grltl ve eksik bilgilerin ilenmesinde yapay sinir alar baaryla kullanlmaktadr. Temel YSA yapsekil 2de gsterilmitir. Klasik bilgisayarlar bilgiyi belleinde belirli bir yerde saklar, sinir alar ise bilgiyi tm aboyunca datr. Bu durum datlm bellek olarak bilinir [3]. 
Giriler 
klar 

k KatmanGizli Katmanlar Giri Katman

ekil 2. ok katmanl bir yapay sinir a

Karakter tanma ilemi zerinde yaplan almalar sonucunda, elle veya bask ile oluturulmukarakterlerin otomatik olarak nasl tannacakonusunda birok teknik gelitirilmitir [1]. 
Karakter tanma ilemi klasik bilgisayar mant ile de yaplabilmektedir. Fakat YSA ynteminin karakter tanma ileminde klasik metotlara gre avantajlyanlar ok daha fazladr. Klasik mantkla karakter tanma olay gerekletirilirken baz durumlar da birok zorluklar ortaya kmaktadr. rnek olarak; dzgn alfa nmerik ekilleri tanyabilmek iin karakteri bir matris haline dntrmek gerekmektedir. A harfinin 75lik bir ikili saydan oluan matris olarak temsil edilmesi ekil 3te gsterilmitir. Matris zerinde dolu bulunan her piksel 1 deerini dier yerler ise 0 deerini almak zere, ekli ikili olarak kodlayabiliriz. Bunu tek bir vektr olarak yazarsak 35 bitlik ikili sayveya buna karlk gelen onluk sayya gre bir karakter tablosundan arama yaplarak karakterin ASCII (American Standard Code for Information Interchange) kodu elde edilir. 


Bu tr bir yaklam hzl ve kolay bir metot olmasna karn gerek sistemlerde uygulanabilirlii yoktur. nk gerek hayattaki verilerde srekli olarak grlt ve bozucu etkiler mevcuttur. Byle bir ortamda aynA karakterinin ASCII dntrcye geldiini varsayalm. Grlt ve etkiler sebebiyle meydana gelebilecek deiimler yukarda anlatlan metodun ilerliini ortadan kaldracaktr. nk bu metot giriverisi ile k verisi arasndaki uyumun tam olmasn gerektirmektedir. Dolaysyla sistem grltl bir ortamda yanl bir sonu retecektir. 

ekil 3. Dzgn bir A karakterinin 7x5lik 
bir matrisle ikili gsterimi 

Bu tr sorunlardan kurtulabilmenin yolu, grltdeki btn pikselleri paralel olarak inceleyebilecek ve bu grltleri ihmal edecek yeni bir ileme sistemidir. Bu sistem, bilinen karakterlere benzeyen fakat grlt nedeniyle bozuk olan ekilleri nceden rendii 
ekillerden  birinin  zelliine  benzetebilmeli  ve  
grlty  tamamen  ihmal  edebilmelidir.  Bu  
zelliklerin  gerekletirilebilecei  sistemler  de  

YSAlardr [1,4]. 

3. RESMDEK TRKE YAZININ METNE DNTRLMES
Bu almada, tek gizli katmanl ileri beslemeli geri yaylml YSA modeli kullanlm olup, sinir ann renme yntemi olarak GDKdan (GenelletirilmiDelta Kural) faydalanlmtr. 
ncelikle tannmak istenilen her desen (karakter) sinir ana retilmelidir. Bu ilem iin yukarda bahsedildii gibi Times New Roman 12 punto ve Arial 11 punto fontlar ile yazlm retilecek desenler rnek seilerek giri vektrlerini oluturmak zere resim dosyas halinde kaydedilirler (ekil 4). Trke de Adan Zye 29 harf vardr. Kk harflerde eklendiinde 58 giri deseni elde edilir. Bu say yalnzca Times New Roman font biimi iindir, 58 tane de Arial iin font eklendiinde, toplam sinir amza reteceimiz giri deseni says 116 olur. 
Gazi niv. Mh. Mim. Fak. Der. Cilt 20, No 1, 2005 



ekil 4. retilecek her karakterin tek bana 
resim dosyaseklinde kaytl hale getirilmesi 

Bu aamada, karakterlerin eitim ve uygulama srasnda sinir ann girileri iin temsil edilme biimlerinde iki farkl yntem gz nnde bulundurulmutur. 
3.1. Karakterlerin Arlk Merkezine DayalGsterimi 
Arlk merkezine dayal tanma, karakterlerin arlk merkezlerinin farkl noktalarda olduu dncesinden ortaya kmtr. ekil 5de baz karakterlerin arlk merkezlerine iaret edilmitir. Bu ekil piksel olarak incelendiinde arlk merkezlerinin ayn noktada olduu sylenebilir. Oysa ki oransal temelden bakldnda farkl olacaktr. Arlk merkezine dayalsnflandrma sabit karakter boyutlarnda iyi sonular vermektedir. Desenler girimatrisine, kendi arlk merkezleri ile matrisin arlk merkezi akacak ekilde yerleirler. 

ekil 5. Eitim desenlerinin arlk merkezleri 

Arlk merkezi kriteri her ne kadar ayrt edici zellik tayorsa da, ayn yaz tipinin farkl byklklerinde arlk merkezi kaymaktadr. Bu nedenle farkl zellik vektrlerine ihtiya duyulmaktadr [5]. 

3.2. Karakterlerin Sabit Bir Desen Matrisinin Bir Noktasna Yerletirilmesi 
renme ilemi srasnda retilecek her karakterin resim biimi hazr olduundan (siyah-beyaz biiminde), bu resim dosyalarndan piksel deerleri okunarak desen matrisinin sol st kenarna yaslanacak ekilde yerletirilir (ekil 6). 
Her iki yaklam iin de, desen matrisi 20x20 olarak sinir ann girilerine gre dzenlenmitir. Bu almada, uygulamada kolaylk olmas asndan karakterlerin sinir ana sunulmasnda ikinci temsil biimi kullanlmtr. 


Uygulamada esnasnda resimden alnan karakterler iin, sinir ann eitiminde ise rnek giri desenleri iin oluturulan bu harf matrisi vektr haline dntrlerek, 400 girili a yapsna sunulur. Aklar uygulanan her harf desenine karlk gelen ASCII kodlar retecek ekilde tasarlanmtr. Girivektr olarak A deseni uygulandnda 9 kl ayaps 65 desimal saysna karlk gelen binary sayy(001000001) retecektir. Bu ekilde sinir a desenleri doru ekilde reninceye kadar eitim ilemine devam edilir. Ancak eitim ilemi tamamlandktan sonra resimden metin elde etme ilemi verimli bir ekilde almaktadr. A girilerine Trke karakterler olan , , , , , , , , , , ,  harfleri uygulandnda, bu harflerin ASCII tablosunda karl olmadndan sinir ana hedef k olarak retilecek deerin ne olaca sorun tekil eder. Bu sorunu zmek iin bu zel Trke harflere zel kodlar oluturulmutur. Normal karakterlerin ASCII kodu retilirken a klar 9 bit olarak atanmtr. 
9. bitin 0 olmaskarakterin ASCII koda sahip olduu anlamna gelmektedir. 9. bit 1 olduunda; rnein kn (100000001)2 (257)10 hedef olmasdurumunda kta elde edilen kod karl 255 den byk olduundan sinir a giriin ǒ karakteri olduunu anlayacaktr. izelge 1de sinir ann eitiminde kullanlan hedef k deerleri gsterilmektedir. Desenleri retme ilemi kabul edilebilir bir hata deeriyle sonlandrldnda, resim zerinden elde edilen karakterlerin sinir ana sunulmas mmkndr. ekil 7de sinir ana uygulanan rnek yaz ieren resim yapsgrlmektedir. 
ekil 7de grlen resimdeki karakterleri elde etme ilemi u ekilde gereklemektedir; ncelikle resim siyah ve beyaz harici tm renklerden arndrlr (Thresold-Eikleme lemi). Bu ilemden sonra resim zerinde iki ayr tarama gerekletirilir. lk olarak, resim yatay eksende taranr ve satrlarn balang ve biti noktalar belirlenir. Her satrn yatay eksendeki balang ve biti noktalar dinamik bir liste yardmyla kaydedilir. Daha sonra her satr dey eksende taranr ve birbirinden ayr harflerin balang 
O.A. Erdem ve E. Uzun Yapay Sinir Alar ile Trke Tmes New Roman, Arial ve Elyazs Karakterleri Tanma izelge 1. Yapay sinir ann eitimi iin hedef k deerleri 
Arial 11pt hedef k deerleri  Times New Roman 12pt hedef k deerleri  
001000001-A 001000010-B 001000011-C 100000001- (257) 001000100-D 001000101-E 001000110-F 001000111-G 100000010- (258) 001001000-H 001001001-I 100000011- (259) 001001010-J 001001011-K 001001100-L 001001101-M 001001110-N 001001111-O 100000100- (260) 001010000-P 001010010-R 001010011-S 100000101- (261) 001010100-T 001010101-U 100000110- (262) 001010110-V 001011001-Y 001011010-Z  001100001-a 001100010-b 001100011-c 100000111- (263) 001100100-d 001100101-e 001100110-f 001100111-g 100001000- (264) 001101000-h 001101001-i 100001001- (265) 001101010-j 001101011-k 001101100-l 001101101-m 001101110-n 001101111-o 100001010- (266) 001110000-p 001110010-r 001110011-s 100001011- (267) 001110100-t 001110101-u 100001100- (268) 001110110-v 001111001-y 001111010-z  001000001-A 001000010-B 001000011-C 100000001- (257) 001000100-D 001000101-E 001000110-F 001000111-G 100000010- (258) 001001000-H 001001001-I 100000011- (259) 001001010-J 001001011-K 001001100-L 001001101-M 001001110-N 001001111-O 100000100- (260) 001010000-P 001010010-R 001010011-S 100000101- (261) 001010100-T 001010101-U 100000110- (262) 001010110-V 001011001-Y 001011010-Z  001100001-a 001100010-b 001100011-c 100000111- (263) 001100100-d 001100101-e 001100110-f 001100111-g 100001000- (264) 001101000-h 001101001-i 100001001- (265) 001101010-j 001101011-k 001101100-l 001101101-m 001101110-n 001101111-o 100001010- (266) 001110000-p 001110010-r 001110011-s 100001011- (267) 001110100-t 001110101-u 100001100- (268) 001110110-v 001111001-y 001111010-z  


ekil 7. rnek yaz ieren taranm resim 
ve biti noktalar belirlenir. Aralarnda en az bir piksel boluk olan harfler birbirinden ayrlabilir [6]. Bu aamada karakterin yatay ve dey eksendeki balang noktalar aradaki boluklar yardmyla tespit edilip yine bir dinamik listeye kaydedilir. Karakterlerin tek tek belirlenmesi esnasnda nemli olan nokta her harf arasnda en az bir piksel boluk olmasdr. Aksi taktirde harfler birbirinden ayrlamaz.  
Bu noktada kelimeler arasndaki boluu tespit etmek zor olur. Bu nedenle dey eksendeki taramalar esnasnda karakterler arasndaki boluklarn piksel olarak deerleri toplamnn aritmetik ortalamasnn, tahmini kelimeler aras bolua eit olduu kabul edilmitir. Eer iki karakter aras boluk hesaplanmtahmini kelimeler aras boluktan fazla ise, bu boluun iki kelime aras boluk olduu sonucuna varlr [7-9]. Bylece kelimeler birbirinden ayrlmolur. Dolaysyla kelime arasndaki boluklar tespit edildiine gre, ne olduu zaten belli olan bir karakterin sinir ana sunulmasna gerek kalmaz. Bu aamada karakterler dorudan ayrlmaz. ekil 8de ilk admda belirlenen veriler grlmektedir. 
lk admda resimden elde edilen veriler olan, karakterlerin yatay ve dey eksenlerdeki balang ve biti noktalar, ikinci admda karakterlerin resimden alnmas ileminde kullanlr. Karakterler resim olarak kartlp hafzada saklanr ve daha sonraki ilem basamaklarna geilir [5,10]. 
Karakterlerin birbirinden ayrlmas tamam fakat satrn ykseklii, karakter ykseklii ile aynolmad iin resimden ayrlan karakterin sol ve sayannda problem olmayacaktr fakat st ve alt ksmlarnda fazlalklar olmas muhtemeldir. Bu nedenle her karakter resmi sinir ana sunulmadan nce bir n ilemden daha geirilmitir. Krpma 
Gazi niv. Mh. Mim. Fak. Der. Cilt 20, No 1, 2005 


ekil 8. Resim zerinde ilk admda elde edilen veriler 
ilemiyle, karakter resminin st ve alt ksmndaki gereksiz ksmlar yok edilerek, resimden elde edilen her karakter ekil 10da grld ekle gelmitir. 
Eer krpma ilemi uygulanmasayd, ekil 9 daki harf biimi 20x20 matrise daha nce anlatld gibi yerletirildiinde retilen harf ile uygulanan harf arasnda iliki kurulamaz ve dolaysyla harf deseni doru bir ekilde tannamazd. ekil 10daki gsterim, harf deseninin retildii biimle ayn olduu iin tanma ilemi sorunsuz gerekleir. Sonu olarak eitimde kullandmz giri matrisi nasl ise, uygulama iin de ayn girimatrisi elde edilmeye allmaldr. Aksi taktirde sinir a girilerine uygulanan deseni tanyamaz [8]. ekil 11deki akemas resimden karakterleri elde etme ve sinir ana uygulama ilemini gstermektedir. 
Sinir ana uygulanan her harf deseni iin a, ASCII kodunu (Trke karakterler iin zel, ASCII kod aralnda olmayan zel bir kod biimi) retecek ve tannan her harf artk metin anlam tayacaktr. Bu aamadan sonra, ekil 12de grld gibi,. Times New Roman ve Arial fontlar gibi standart karakterlere, ekil 13den grld gibi, elyazsformunda olan cmlelere, ekil 14den grld gibi, elyazs harfler zerinde her trl biimlendirme, dzeltme, ekleme ve karma ilemleri gerekletirilen metin elde edilmitir. 

ekil 9. Krpma ileminden nce ekil 10. Krpma ileminden sonra elde edilen r harfi r harfi 

Sradaki karakteri aa uygula ve a klarn ret 
Sinir an, uygulanacak giridesenleri iin eit 
Sinir ann kta rettii ascii koda karlk gelen karakteri metne ekle 



Resimden karakterleri al 



Sonu olarak oluturulan metni gster 





O.A. Erdem ve E. Uzun Yapay Sinir Alar ile Trke Tmes New Roman, Arial ve Elyazs Karakterleri Tanma 




4. SONU VE NERLER 
Yaplan bu alma gnlk hayatta kullanlabilecek Arapa, Farsa karakterleri gibi, baz uygulamalarda denenememitir. Fakat gerekletirilen uygulama bunlara baz deiiklikler ile uyarlanabilir. rnein; tarayc kullanlarak elde edilen bir kitap sayfasndaki metni okuyabilen bir uygulamaya uyarlamak mmkndr. Kurulacak sistemde resim eklinde kaydedilen kitap sayfasndan, resim ileme yntemleri ile karakterler birer birer alnr ve daha nceden eitilen YSA kullanlarak karakter tanma ilemi gerekletirilebilir. Bu tanma ilemi, almada gelitirilen program aracl ile gerekletirilmektedir. Burada dikkat edilmesi gereken en nemli husus; tarayc ile sayfalar resim eklinde elde ederken mmkn olduunca bozulmasn nlemek olmaldr. Aynekilde, niversite yerlekesi gibi girive klarn denetimli olarak salanmas gereken yerlerde kullanlan ara plaka tanma sistemleri de bu uygulamadan faydalanlarak gerekletirilebilir. Kamerayla belirli bir uzaklkta duran aracn plakasnn resmi ekilir. Resim ileme yntemleri kullanlarak, plaka zerindeki harf ve rakamlar elde edilir ve daha nceden bu harf ve rakamlar tanmak zere eitilmi YSAna sunulur. Sonuta resim biimindeki plaka, anlamlharf ve rakam deerleri ieren bir bilgiye dnr. Elde edilen bu bilgi kullanlarak veritaban sorgulamas ile aracn giriveya k iin yetkisinin olup olmadna karar verilir.  
Gazi niv. Mh. Mim. Fak. Der. Cilt 20, No 1, 2005 


Gelitirilen algoritma ve program, kvrml ve birbirlerine temas eden harflere sahip dillere de uygulanabilir. Bunun iin harflerin birbirine temas etmesinden kaynaklanacak sorunlar giderilmelidir. Gnmzde standart bilgisayar karakterlerini tanmak elyazs karakterlere gre daha kolay iken, elyazs ile yazlan karakterlerin binlerce eit olabilmesinden dolay, tanmak zor ve kstldr. Bu gibi uygulamalarn baars an retilmesine bal olarak deimektedir. Daha nce retilmi el yazlarnda %004 orannda hatal sonular alnmaktadr. retilmemi el yazlarnda ise, bu oran yaklak olarak % 4 civarndadr. Geriye yaylm anda gizli katmandaki nron miktaran hatrlama ve performans zerinde ok etkili olmaktadr. Gizli katmanlardaki nron saysnn fazlal eitim ileminin fazla zaman almasna neden olurken an hatrlama kabiliyetini de ayn oranda artrmaktadr. Eer ilem elemanlarnn says fazla tutulursa eitimden sonra hatrlama kabiliyeti de o kadar iyi olmaktadr. Ancak iyi bir eitim sonrasnda da gizli katmandaki nron saysnn az olmas an hatrlama kabiliyeti zerinde fazla etkili olmamaktadr. Sonu olarak, yapay sinir alar, algoritmalarkarlamayan problemler iin, zm salayan yeni ve gvenli bir bilgi ileme sistemi olabilmektedir. Yaplan alma bu durum iin uygun bir rnek durumundadr. 



